知识图谱的四种存储格式,N |
您所在的位置:网站首页 › 三元组 rdf › 知识图谱的四种存储格式,N |
知识图谱通常是存储为的三元组形式。 实体或者值为节点,关系作为边构成图谱。 RDF (Resource Description Framework) 通常以四种格式存储: N-Triples (.nt)、Turtle (.ttl)、JSON-LD (.json)或RDF/XML (. RDF)。 nt格式呢,就是每行一个三元组,实体、关系都是最完整的格式,有前缀,很长那种。 . "Bob Marley"@en . "Bob Marley"@fr . . . . "Jamaica"@en . "Giamaica"@it . "17.9833"^^ . "-76.8"^^ . .ttl格式,就是在开头先定义了前缀,三元组要短很多。 所以这种格式一般比nt格式小不少。 @prefix dbr: . @prefix dbo: . @prefix rdfs: . @prefix foaf: . @prefix geo: . @prefix xsd: . @prefix schema: . dbr:Bob_Marley a foaf:Person ; rdfs:label "Bob Marley"@en ; rdfs:label "Bob Marley"@fr ; rdfs:seeAlso dbr:Rastafari ; dbo:birthPlace dbr:Jamaica . dbr:Jamaica a schema:Country ; rdfs:label "Jamaica"@en ; rdfs:label "Giamaica"@it ; geo:lat "17.9833"^^xsd:float ; geo:long "-76.8"^^xsd:float ; foaf:homepage .json格式就不用说了,常见的数据存储格式,层次化的可嵌套结构,看下面例子。 [ { "@id": "http://dbpedia.org/resource/Bob_Marley", "@type": [ "http://xmlns.com/foaf/0.1/Person" ], "http://www.w3.org/2000/01/rdf-schema#label": [ { "@value": "Bob Marley", "@language": "en" }, { "@value": "Bob Marley", "@language": "fr" } ], "http://www.w3.org/2000/01/rdf-schema#seeAlso": [ { "@id": "http://dbpedia.org/resource/Rastafari" } ], "http://dbpedia.org/ontology/birthPlace": [ { "@id": "http://dbpedia.org/resource/Jamaica" } ] }, { "@id": "http://dbpedia.org/resource/Jamaica", "@type": [ "http://schema.org/Country" ], "http://www.w3.org/2000/01/rdf-schema#label": [ { "@value": "Jamaica", "@language": "en" }, { "@value": "Giamaica", "@language": "it" } ], "http://www.w3.org/2003/01/geo/wgs84_pos#lat": [ { "@value": "17.9833", "@type": "http://www.w3.org/2001/XMLSchema#float" } ], "http://www.w3.org/2003/01/geo/wgs84_pos#long": [ { "@value": "-76.8", "@type": "http://www.w3.org/2001/XMLSchema#float" } ], "http://xmlns.com/foaf/0.1/homepage": [ { "@id": "http://jis.gov.jm/" } ] }, { "@id": "http://dbpedia.org/resource/Rastafari" }, { "@id": "http://jis.gov.jm/" }, { "@id": "http://schema.org/Country" }, { "@id": "http://xmlns.com/foaf/0.1/Person" } ]RDF格式,好像现在已经不怎么常用了,但是作为一种标准存在。 和HTML的形式很类似,并且可以和ttl一样在开头可以定义前缀。 Bob Marley Bob Marley Jamaica Giamaica 17.9833 -76.8选择哪种格式,实际上主要取决于你想要使用那种库去处理它们。 一般来说,现在nt和ttl这两种以每行一个三元组格式存储的格式使用得比较多,也容易处理、存储。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |